Efecto de ReLU en el sesgo implícito en redes de alta dimensión Descubre cómo la activación ReLU influye en el sesgo implícito del descenso de gradiente, aproximándose a la solución de mínima norma L2 en datos de alta 2026-06-18 · 1 min